دیپ لرنینگ (Deep Learning) تلاش می‌کند تا از مغز انسان تقلید کند (البته نمی‌تواند به توانایی‌ها مغز انسان نزدیک نیز بشود)، سپس سیستم‌ها را قادر می‌سازد تا داده‌ها را خوشه بندی کنند و با دقتی باورنکردنی چیزهایی را پیش بینی کنند. تا ادامه‌ی مطلب همراه باشید تا به جزئیات بیشتری در رابطه با دیپ لرنینگ بپردازیم.

 

دیپ لرنینگ چیست؟

تکنولوژی دیپ لرنینگ زیر مجموعهای از یادگیری ماشینی (Machine Learning) است که در اصل یک شبکه عصبی با سه لایه یا بیشتر می‌باشد. این شبکه‌های عصبی تلاش می‌کنند تا رفتار مغز انسان را شبیه سازی کنند (که همان‌طور که اشاره شد، این شبیه سازی با توانایی‌های اصلی مغزی انسان فاصله زیادی دارد). این شبیه سازی به دیپ لرنینگ اجازه می‌دهد به مقادیر زیادی داده دسترسی داشته و از آن‌ها «یاد بگیرد». در حالی که یک شبکه عصبی با یک لایه هم میتواند پیش بینیهای تقریبی انجام دهد، لایههای پنهان اضافی میتوانند به بهینه سازی، اصلاح و رسیدن به دقت بیشتر کمک کنند.

دیپ لرنینگ بسیاری از برنامهها و خدمات هوش مصنوعی (AI) را هدایت میکند و اتوماسیون را بهبود میبخشد، همچنین وظایف تحلیلی و فیزیکی را بدون دخالت انسان انجام میدهد. تکنولوژی دیپ لرنینگ درواقع فناوری پشت پرده‌ی محصولات و خدمات روزمره (مانند دستیارهای دیجیتال، کنترل‌های تلویزیون با قابلیت صوتی و تشخیص تقلب در کارت اعتباری) و همچنین فناوری‌های نو ظهور (مانند خودروهای خودران) است.

دیپ لرنینگ در مقابل یادگیری ماشینی

اگر دیپ لرنینگ زیر مجموعه‌ای از یادگیری ماشینی است، پس این دو چه تفاوتی با هم دارند؟ پاسخ این است که با توجه به نوع دادهای که دیپ لرنینگ با آن کار میکند و روشهایی که در آن یاد میگیرد، این زیر مجموعه از یادگیری ماشینی کلاسیک متمایز است.

الگوریتم‌های یادگیری ماشینی از داده‌های ساختار یافته و برچسب گذاری شده برای پیش بینی استفاده می‌کنند، به این معنی که ویژگی‌های خاصی از داده‌های ورودی برای مدل تعریف شده و در جداول سازمان دهی می‌شوند. این مسئله لزوماً به این معنی نیست که یادگیری ماشینی از دادههای بدون ساختار استفاده نمیکند، بلکه فقط به این معنی است که اگر این کار را انجام دهد، معمولاً برای سازماندهی آن در قالبی ساختار یافته از پیش پردازش شده میگذرد.

دیپ لرنینگ، برخی از پیش پردازش دادهها را که معمولاً با یادگیری ماشینی مرتبط است، حذف میکند. این الگوریتم‌ها می‌توانند داده‌های بدون ساختار، مانند متن و تصاویر را دریافت و پردازش کنند، و استخراج ویژگی‌ها را خودکار می‌کند و برخی از وابستگی به انسان‌های متخصص را از بین می‌برد. به عنوان مثال، فرض کنید مجموعه‌ای از عکس‌های حیوانات خانگی مختلف داریم و می‌خواهیم آن‌ها را در دسته بندی‌های «گربه»، «سگ»، «همستر» و غیره مرتب کنیم. الگوریتم‌های دیپ لرنینگ می‌توانند تعیین کنند که کدام ویژگی‌ها (به عنوان مثال گوش‌ها) برای تشخیص هر حیوانی از حیوان دیگر مهم‌تر هستند. در یادگیری ماشینی، این سلسله مراتب ویژگیها به صورت دستی توسط یک انسان متخصص ایجاد میشوند.

 

سپس، از طریق فرایندهای کاهش با شیب و پس انتشار، الگوریتم دیپ لرنینگ تنظیم میشوند و شروع به افزایش دقت خود می‌کنند؛ این روند باعث می‌شود الگوریتم دیپ لرنینگ بتواند در مورد یک عکس جدید از یک حیوان با دقت بیشتری پیش بینی کند.

مدلهای یادگیری ماشینی و دیپ لرنینگ نیز توانایی یادگیری‌های مختلف را دارند که معمولاً به عنوان یادگیری نظارت شده، یادگیری بدون نظارت و یادگیری تقویتی طبقه بندی میشوند. یادگیری نظارت شده از مجموعه دادههای برچسب گذاری شده برای دسته بندی یا پیش بینی استفاده میکنند. این نوع یادگیری نیاز به نوعی مداخله انسانی برای برچسب گذاری صحیح دادههای ورودی دارد. در مقابل، یادگیری بدون نظارت به مجموعه داده‌های برچسب گذاری شده نیاز ندارد، و در عوض، الگوهای موجود در داده‌ها را شناسایی می‌کند و آنها را بر اساس هر ویژگی متمایزی خوشه بندی می‌کند. یادگیری تقویتی فرایندی است که در آن یک مدل میآموزد که برای انجام یک عمل در یک محیط بر اساس بازخورد، دقیقتر شود تا پاداش را به حداکثر برساند.

دیپ لرنینگ چگونه کار میکند

شبکه‌های عصبی دیپ لرنینگ یا شبکه‌های عصبی مصنوعی، تلاش می‌کنند از طریق ترکیبی از ورودی داده‌ها، وزن‌ها و سوگیری از مغز انسان تقلید کنند. این عناصر برای تشخیص دقیق، طبقه بندی و توصیف جزئیات دادهها با هم کار میکنند.

شبکه‌های عصبی عمیق از چندین لایه از گره‌های به هم پیوسته تشکیل شده‌اند که هر کدام بر روی لایه قبلی برای اصلاح و بهینه سازی، پیش بینی یا طبقه بندی ساخته می‌شوند. این پیشروی محاسبات از طریق شبکه، انتشار رو به جلو نامیده میشود. لایههای ورودی و خروجی یک شبکه عصبی عمیق را لایههای مرئی مینامند. لایه ورودی جایی است که مدل دیپ لرنینگ دادهها را برای پردازش جذب میکند و لایه خروجی جایی است که پیش بینی یا طبقه بندی نهایی انجام میشود.

 

فرایند دیگری به نام پس انتشار از الگوریتم‌هایی مانند کاهش گرادیان برای محاسبه خطاها در پیش بینی‌ها استفاده می‌کند و سپس وزن‌ها و سویه‌های تابع را با حرکت به سمت عقب در لایه‌ها در تلاش برای آموزش مدل تنظیم می‌کند. انتشار رو به جلو و پس انتشار به یک شبکه عصبی اجازه میدهد تا پیش بینی کند و هر گونه خطا را بر اساس آن تصحیح کند. با گذشت زمان، الگوریتم به تدریج دقیقتر میشود.

مطالب توضیح داده شده در بالا سادهترین نوع شبکه عصبی عمیق را با سادهترین عبارات و به ساده‌ترین شکل ممکن توصیف میکند. با این حال، الگوریتمهای دیپ لرنینگ بسیار پیچیده هستند و انواع مختلفی از شبکههای عصبی برای رسیدگی به مشکلات یا مجموعه دادههای خاص وجود دارد. به عنوان مثال:

 

شبکه‌های عصبی کانولوشن (CNN که عمدتاً در برنامه‌های بینایی کامپیوتری و طبقه بندی تصویر مورد استفاده قرار می‌گیرند، می‌توانند ویژگی‌ها و الگوهای درون یک تصویر را شناسایی کنند و کارهایی مانند تشخیص یا شناخت اشیا را ممکن می‌سازند. در سال 2015، یک شبکه CNN برای اولین بار موفق شد یک انسان را در چالش تشخیص اشیا شکست دهد.

شبکه عصبی بازگشتی (RNN معمولاً در کاربردهای زبان طبیعی و تشخیص گفتار استفاده می‌شود، زیرا از داده‌های مجموعه زمانی یا ترتیبی استفاده می‌کند.

برنامه‌های دیپ لرنینگ

برنامه‌های کاربردی دیپ لرنینگ در دنیای واقعی بخشی از زندگی روزمره ما هستند، اما در بیشتر موارد، آن‌قدر به خوبی در محصولات و خدمات ادغام شدهاند که کاربران از پردازش پیچیده‌ی دادههایی که در پس زمینه انجام میشوند، بی اطلاع هستند. برخی از این نمونهها شامل موارد زیر است:

 

اجرای قانون

الگوریتم‌های دیپ لرنینگ می‌توانند داده‌های تراکنش‌ها را تجزیه و تحلیل کنند و از آنها بیاموزند تا الگوهای خطرناکی را که نشان دهنده فعالیت‌های احتمالی کلاهبرداری یا مجرمانه هستند، شناسایی کنند. تشخیص گفتار، بینایی کامپیوتری و سایر برنامه‌های دیپ لرنینگ می‌توانند با استخراج الگوها و شواهد از صدا و ویدئوهای ضبط شده، تصاویر و اسناد، عملکرد و اثربخشی تجزیه و تحلیل تحقیقاتی را بهبود بخشند، که به مجری قانون کمک می‌کند تا مقادیر زیادی از داده‌ها را با سرعت و دقت بیشتری تجزیه و تحلیل کنند.

خدمات مالی

مؤسسات مالی به طور منظم از تجزیه و تحلیل و پیش بینی‌های دیپ لرنینگ برای هدایت معاملات الگوریتمی سهام، ارزیابی ریسکهای تجاری برای تأییدیههای وام، کشف تقلب و کمک به مدیریت نمونه کارهای اعتباری و سرمایه گذاری برای مشتریان استفاده میکنند.

 

خدمات مشتری

بسیاری از سازمانها فناوری دیپ لرنینگ را در فرایندهای خدمات مشتری خود گنجاندهاند. ربات‌های مخصوص چت (چت بات)، که در انواع برنامه‌ها، خدمات و پورتال‌های خدمات مشتری استفاده می‌شوند، شکل ساده‌ای از هوش مصنوعی هستند. چت بات‌های سنتی از زبان طبیعی و حتی تشخیص بصری استفاده میکنند که معمولاً در منوهای مرکز تماس یافت میشوند. با این حال، در روش‌های پیچیدهتر، چت بات‌ها تلاش می‌کنند تا از طریق یادگیری، تعیین کنند که آیا پاسخ‌های متعددی به سؤالات مبهم وجود دارد یا خیر. بر اساس پاسخهایی که دریافت میکنند، چت بات‌ها تلاش میکنند مستقیماً به این سؤالات پاسخ دهند یا مکالمه را به یک کاربر انسان هدایت کنند.

دستیارهای مجازی مانند سیری از Apple، الکسا از Amazon یا دستیار Google، ایده چت بات را با فعال کردن قابلیت تشخیص گفتار گسترش میدهند. این دستیارهای مجازی یک روش جدید برای ارتباط برقرار کردن با کاربران به روشی شخصی سازه شده است.

مراقبتهای بهداشتی

از زمان دیجیتالی شدن سوابق و تصاویر بیمارستانی، صنعت مراقبتهای بهداشتی از قابلیتهای دیپ لرنینگ بهره برده است. برنامه‌های تشخیص تصویر می‌توانند به یاری متخصصان تصویر برداری پزشکی و رادیولوژیست‌ها شتافته و به آن‌ها در تجزیه و تحلیل و ارزیابی تصاویر بیشتر در زمان کمتر کمک کنند.

 

الزامات سخت افزاری دیپ لرنینگ

دیپ لرنینگ به قدرت محاسباتی زیادی نیاز دارد. واحدهای پردازش گرافیکی با عملکرد بالا (GPU) برای این فناوری ایده آل هستند زیرا میتوانند حجم زیادی از محاسبات را در چندین هسته با حافظه فراوان موجود انجام دهند. با این حال، مدیریت چندین کارت گرافیک (GPU) در یک محل می‌تواند منابع داخلی زیادی را مصرف کند و باعث شود انجام این کار در مقیاس بالا بسیار پرهزینه باشد.